原文:
Sizing The Big Data Market: No One Has A Clue – ReadWrite
[摘譯]
讓我們忘了那些關於巨資料(Big Data)的數據吧。真正的事實,是沒有人知道巨資料的商業市場表現,因為很少人真的知道到底什麼是巨資料。
Gartner 的副總
Ian Bertram 指出,50%的企業認為他們在巨資料議題上所遭遇的問題在於異質資料的統整 (variety),而非大量的資料 (volume) ([譯按] 巨資料有所謂的 3V:「多樣性」 variety,「大量」 volume,以及「速度」 velocity。),所以「巨」顯然不是個真議題。
Marketo 的
Jon Miller 說:「所謂的『巨資料』,是一個概略性的詞彙,意指一種極度大量、極度複雜的資料,超出了 1980 年代以來關聯式資料庫所能處理的範圍,所以亟需新的處理方式。」既然是一個「概略性的詞彙」,那我們怎麼能界定一個新的應用是不是屬於「巨資料」的範疇?
我在想,會不會我們在說「巨資料」的時候,說的其實只是「資料」?我們所謂的「巨」並沒有實質的意義,只是我們可以把「比以前更多」的資料拿來發揮作用而已。
我很想問,為什麼要叫做「巨資料」?它到底「巨」在哪裡?為什麼不乾脆叫做「資料」或「資訊」?反正我們說的僅僅是從不同的資料來源抽取數據然後統整在一起,或許加上尋找特定型態,建立模型,指出風險,理解人的意圖與情感,建立網絡,這些事情而已。
換句話說,我們做的事情跟從前毫無差別:「讓資料發揮作用」,差別只是把工具換成 Hadoop 和 NoSQL,讓我們可以更有效率的做更多事情。
[譯按]
我喜歡這篇文章的副標題:
Big Data is a meaningless term that attempts to describe what we've spent years doing: putting data to work.
「巨資料只是一個無意義的字眼,試圖描述我們過去一直在做的事情:『讓資料發揮作用』」
前陣子在朋友轉貼的 Big Data 相關文章上回應:「Big Data 到現在已經成了行銷字眼,跟它起鬨你就紅了,跟它認真你就輸了」,大概也是差不多的意思。君不見我這兒正是在跟著Big Data 起鬨嗎?XD